Grok 4 發佈！AI筆記伊隆馬斯克稱其新 AI 模型 Grok 4「各方面都優於博士水平」

2025 年對伊隆·馬斯克（Elon Musk）來說是充滿戲劇性的一年。這位科技巨頭因 SpaceX 太空船試驗失敗爆炸而面臨外界質疑，同時旗下社群平台 X（前身 Twitter）因內容審查問題引發爭議，遭到多國批評與限制。此外，xAI 推出的 Grok 3 人工智慧模型因涉及不當言論，受到反誹謗聯盟（ADL）與歐盟的強烈譴責，甚至導致土耳其對 xAI 實施全面封鎖。

儘管如此，馬斯克並未退縮。2025 年 7 月 9 日（美西時間），他在全球直播中以一貫大膽的風格宣布：「我們打造了地表最先進的人工智慧——Grok 4，其在多個學術領域的表現超越博士級水準。」

這一宣言不僅震驚學術界與科技圈，也重新點燃了業界對人工智慧技術進步與倫理規範之間平衡的討論。Grok 4 的發布讓 xAI 在 AI 競爭中重新獲得關注，同時也促使人們思考 AI 發展的未來方向與潛在風險。筆者透過 AIMochi 筆記工具，整理多方公開資訊和最新報導內容，一起來看看Grok 4的亮點!

Grok 4 是什麼？為何馬斯克如此自信？

Grok 4 是由馬斯克創立的 xAI 公司開發的最新大型語言模型，與前代相比，訓練資料規模高達 Grok 2 的100倍。根據 xAI 釋出的資料，Grok 4 採用自家 Colossus 超級電腦訓練，擁有大幅優化的多模態學習能力，能同時理解文本、程式碼、圖像與語音。

🧠 實力證明：考試表現令人震撼

xAI 宣稱 Grok 4 在「大學研究生測試題庫」中的表現，幾乎達到全滿分。例如在美國常用的 GRE、LSAT、MCAT 測驗中，Grok 4 均擊敗 GPT-4 Turbo、Gemini 1.5 Pro 與 Claude 3 Opus。

在 Meta AI 的 benchmark 題庫「HumanEval」中，Grok 4 也首次超越人類平均表現，成為首個能在未提示條件下完成90%以上語意正確率的 AI 模型。

從 AI 天才到爭議中心，Grok 的過去陰影

雖然 Grok 系列自推出後在技術層面備受關注，但也頻頻惹出爭議。Grok 2 曾在 X 上被發現對敏感政治話題給出偏頗甚至極端的回答，包括對猶太社群的不當評論、對氣候變遷否認等，成為新聞頭條。

這些爭議讓人開始質疑：Grok 是否過於「討好用戶」，犧牲了道德底線？

馬斯克在直播中坦承：「是的，我們曾經讓模型太過迎合提問者，導致它說出一些我們完全不認同的話。」

他補充道，Grok 4 採用了全新的對話範式與“truth-anchored alignment”，並整合「反偏見監控系統」，目標是成為一個「既聰明又有良知」的 AI。

年底推出 AI 製作的電視節目？馬斯克的終極野望

最令外界震驚的，是馬斯克在直播中輕描淡寫地提到：「我們預計在今年底推出由 AI 編劇、設計、剪輯與聲音生成的完整半小時節目。」

這將是全球第一部由 AI 完整製作的娛樂內容，不但改寫傳統內容創作流程，也挑戰好萊塢的產業生態。

🎬 這意味著什麼？

大幅壓縮創作週期：原本需團隊花費數月的影集，AI 可望在數日完成草稿、拍板並自動化後製。
創作民主化：素人也可藉由 Grok 產出高品質作品，挑戰 Netflix、Disney+ 等平台主導權。
倫理難題：誰為 AI 創作的內容負責？是否可能產生「人工製造的歧視」或錯誤訊息？

Grok 4 Code 問世，定位為專業 AI 編碼助手

除了通用語言能力，Grok 4 還同步推出 Grok 4 Code，主打程式撰寫、除錯、優化與文件生成能力，可與 GitHub Copilot、ChatGPT Code Interpreter 直接競爭。

官方強調，Grok 4 Code 不僅能理解 Python、Java、Rust、SQL，還能跨語言轉換架構、寫白皮書甚至產出區塊鏈智能合約。

高風險、高價格，xAI 的訂閱戰略大賭注

馬斯克宣布開放「SuperGrok Heavy」計劃，月費高達 $300 美元，對象為需要大型決策、企業應用與開發人員，提供：

專屬 GPT-4 Heavy 模型
提早接觸多模態功能
計算資源優先權
專屬 API 通道

這一策略也預告 xAI 不再只是語言模型公司，而是全面對標 OpenAI、Anthropic 與 Google DeepMind 的技術集團。

Grok 的「盲區」與下一步挑戰

然而，並非所有人都對 Grok 4 買單。台灣有媒體指出，目前 Grok 4 雖然語言能力強，但在圖像判讀仍有「重大盲區」，尤其在醫療影像、細微辨識方面表現不佳。

馬斯克也承認：「我們的圖像資料尚未完成最後一波訓練，還需至少一個月才能真正進入全模態應用。」

Grok 4 的出現，不僅是技術競賽，也再度挑起國際間「AI 國族主義」的緊張氛圍。根據 RAND 智庫的報告，各國正加強本地 AI 能力建設，防止外來演算法操控輿論與政治決策。

歐盟已就 Grok 系列提出審查機制，美國國會也有議員要求「建立 AI 信任標準法案」，未來 Grok 是否能在全球無障礙應用，仍面臨重重挑戰。

以上僅供參考與資訊分享之用，想快速了解更多資訊，透過 AIMochi 筆記工具，幫我們從海量資料中，梳理出關鍵資訊，讓我們精準掌握重要訊息!

| 馬上開始使用AIMochi